全概率公式(Total probability formula)
设$B_1,B_2,…B_n$为样本空间$S$ 的一个划分, 全概率公式为:
$P(A) = \sum_{j=1}^n P(B_j)·P(A|B_j)$
举个栗子
设有m个球,n个红球(n>2),m-n个白球,不放回地抽2个球,求第二次抽到红球的概率, 设第1次抽到红球为事件$B$, 第2次抽到红球为事件$A$, 事件$A$的全概率公式如下: :
$P(A) = P(B)·P(A|B) + P(\overline{B})·P(A|\overline{B}))$
$(P(B) + P(\overline{B}) = 1)$
设有m个球,n种颜色,其中有k个红球(k>2),不放回地抽2个球,求第二次抽到红球的概率, 设第1次抽到颜色 $j$ 的球为事件$B_j$, 第2次抽到红球为事件$A$, 事件$A$的全概率公式如下:
$P(A) = \sum_{j=1}^n P(B_j)·P(A|B_j)$
$ (\sum_{j=1}^n P(B_j) = 1)$
综上可得
全概率公式就是设$B_1,B_2,…B_n$为样本空间$S$ 的一个划分 ,而求$A$事件的概率可在各个$B$事件发生的前提下发生$A$的概率的总和,亦可以路径图理解,如下:
贝叶斯公式(Bayes formula)
- 简式贝叶斯公式:
$P(B|A) = \frac{P(B)·P(A|B)}{P(A)}$
若$B_1,B_2,…B_n$为样本空间$S$ 的一个划分,可将$P(A)$展开为全概率公式:
$P(B_i|A) = \frac{P(B_i)·P(A|B_i)}{\sum_{j=1}^n P(B_j)·P(A|B_j)}$
先验概率(Prior probability)与后验概率(posterior probability)与似然值(likelihood)
$P(B|A) = \frac{P(B)·P(A|B)}{P(A)}$ → $posterior = \frac{prior · likelihood}{evidence}$
公式中的$P(B|A)$就是后验概率,$P(B)$就是先验概率,$P(A|B)$就是似然值。
由公式可知,“后验$P(B|A)$” 受 “先验$P(B)$” 和 “似然$P(A|B)$” 影响,但并不取决于先验概率或似然值。比如$P(B)$很大,只要$P(A|B)$足够小,$P(B|A)$也可以很小。同理$P(A|B)$很小,若$P(B)$足够大,$P(B|A)$也可以很大。
举个栗子
一年365天,有36天下雨,把下雨频率当作每天下雨的概率,我们近似为10%,天气预报人员会对每天进行天气预测,假如一年内下雨的时候,天气预报人员都预报了下雨,而有一年内64天没下雨的时候天气预报人员也预报了下雨。那现在天气预报人员预测明天会下雨,那明天真的会下雨的概率是多少?
$P(下雨 | 预测明天下雨) = \frac{P(下雨) · P(预测明天下雨 | 下雨)}{P(预测明天下雨)} $
$= \frac{0.1 · 1}{100/365}$
$=0.365$
由此可得,即使下雨的时候天气预报人员都预报准了,即$P(预测明天下雨 | 下雨)=1$, 好像准确率好高的样子,人们也会根据天气预报人员下雨的天数都预测准了的现象,惯性地感觉天气预报人员预报明天下雨就肯定下雨了,这就是先验影响了人们的惯性感觉,
但其实根据贝叶斯公式,若先验概率太小,哪怕天气人员预测明天会下雨,明天真的会下雨的概率也就只有36.5%。